هم ترازی جملات دادگان فارسی-عربی با روش مبتنی بر واژه نامه دوزبانه

پایان نامه
چکیده

امروزه با گسترش یافتن وسایل ارتباط جمعی به ویژه اینترنت، نیاز و علاقه به ترجمه خودکار، افزایش یافته است. روش ها و سیستم های مختلفی برای ترجمه ماشینی به وجود آمده است که در سال های اخیر، روش ترجمه ماشینی آماری مطرح ترین آن ها می باشد. پیکره های چندزبانه، یکی از اساسی ترین منابع شاخه های مختلفی از پردازش زبان طبیعی مانند بازیابی اطلاعات چندزبانه و ترجمه ماشینی آماری می باشد. پیکره های چندزبانه انواع مختلفی دارند که پیکره موازی مطلوب ترین آن ها برای ترجمه ماشینی، می باشد. پیکره موازی موردنیاز سیستم ترجمه ماشینی آماری بایستی در سطح جمله تراز شده باشد. روش های مختلفی برای هم ترازی جملات وجود دارد که می توان به روش های مبتنی بر طول، مبتنی بر واژه نامه، ترکیبی و ... اشاره کرد. در این تحقیق، روشی مبتنی بر واژه نامه، برای هم ترازی پیکره های فارسی-عربی که دارای حالات هم ترازی چند به یک و چند به چند زیادی می باشد ارائه شده است. واژه نامه دوزبانه حجیمی با استفاده از پیکره های موازی موجود، تولید شده و با استفاده از ریشه یاب فارسی و عربی این واژه نامه غنی و کامل تر می گردد. در این روش، پس از به دست آوردن ماتریس شباهت جملات، برای یافتن جملات مشابه هر جمله، از گراف دوقسمتی استفاده می شود. این رهیافت علاوه بر حالت های ساده 1-1 و 1-0 موارد پیچیده تر را نیز (حالت های چند به یک و چند به چند) تشخیص داده و ترازبندی می کند.

منابع مشابه

بررسی کارآمدی روش های موجود در بازیابی اطلاعات بین زبانی فارسی- انگلیسی با استفاده از واژه نامه دوزبانه ماشین خوان

در این پژوهش میزان تأثیر انجام پردازش های زبان طبیعی بر روی ترجمه عبارت های جستجو با آزمون فرضیه های پژوهش مشخص گردید. فنون پردازش زبان طبیعی که برای پردازش عبارت های جستجو به کار گرفته شد شامل قطعه بندی متن، شناخت گونه های زبانشناختی، حذف سیاهه بازدارنده، تحلیل مورفولوژیک، و برچسب زنی انواع نقش دستوری بود. آزمون فرضیه اول نشان داد که استفاده از روش ترجمه اولین برابرنهاده در مقایسه با شیوه انتخ...

متن کامل

ادیبان دوزبانه سلجوقی و تحولات زبان فارسی و عربی

زبان فارسی و عربی، به سبب هم­جواری و تعاملات دوسویه، از دوره باستان تا کنون، بر اثر مناسبات فرهنگی و سیاسی بسیار از یکدیگر متأثر شده‌اند. اما در قرن پنجم هجری خاصه در عصر سلجوقیان به سبب رقابت­های علمی و ادبی میان شاهزادگان و امیران ولایت­های مختلف این تأثیرپذیری و اختلاط وارد بسیاری از واژه­های دو زبان شد که نهایتاً به تکامل تدریجی آن­ها منجر گردید. این پژوهش بر اساس منابع ادبی و تاریخی، نیز تح...

متن کامل

واژه های هم بنیاد فارسی

در زبان فارسی امروز واژگانی وجود دارد که از فارسی باستان و اوستایی، با تحولاتی که از دو طریق زبان پهلوی اشکانی و پهلوی ساسانی یافته، به دو و گاهی سه صورت به زبان فارسی امروز رسیده­اند که در فرهنگهای فارسی پس از اسلام، به سبب عدم شناخت و چگونگی تحول آنها، هر یک چون واژه­ای مستقل به کار رفته­اند و هیچ­یک از فرهنگ­نویسان اشاره­ای به یک اصل داشتن آنها نکرده­اند. تنها گه­گاه برخی، آنها را واژه­های م...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

دانشگاه تربیت معلم - تهران - دانشکده مهندسی برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023